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Identification of Proteins from Gastrodia elata by Two- 
Dimensional Electrophoresis and Peptide 
Mass Fingerprinting 


ZHANG Xiao-Qin[] HU Jin-Yongl] ZENG Ying" [] LIU Xiao-Zhu 
0 Kunming Institute of Botany|] Chinese Academy of Sciences] Kunming 650204[] China[] 


Abstract[] Proteins extracted from the cortex of fungi-infected nutritive corms and non-infected secondary 
corms of Gastrodia elata were separated by two dimensional polyacrylamide gel electrophoresi$] 2-DE{] with 
immobilized pH gradientd] IPG[]. Reference maps were obtained with a good reproducibility. Approxi- 
mately 900 proteins per 2-DE gel were isolated with molecular weights ranging 12 — 97 kD and p/ 3 - 10. 
The spots showed a symmetric shape indicating a good resolution in both electrophoresis dimensions. Five 
proteins of high levels observed in a secondary corm gel were excised and identified using peptide mass fin- 
gerprinting and matrix-assisted laser desorption ionization time-of-flight mass spectrometry. А summary of 
the identified proteins and their putative functions are presented. One of then spot по. 4 is identified as 
a RNA-binding protein involved in transcription. Technical details concerning database queries and protein 
identification success rates in the absence of a sequenced genome are reported and discussed. Parameters 
for sample preparation are critically investigated. 
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能 含有 蜜 环 菌 蛋 白质 。 因 此 从 新 生 球 荃 的 双向 电泳 胶 上 选取 5 个 表达 量 明显 高 于 染 菌 球茎 
的 蛋白 质点 (图 1， 箭 头 标 记 1~ 5)， 这 5 个 蛋白 质点 在 不 同 的 天 麻 个 体 表达 量 相当 ， 都 
表现 为 新 生 球茎 中 的 含量 明显 高 于 其 相应 的 染 菌 球茎 。 


3 IC 





图 1 RREZ (Ze) MUZE (A) 双向 电泳 银 染 图 谱 
箭头 和 数字 标记 的 蛋白 点 用 于 质谱 鉴定 ， 图 中 的 蛋白 编号 与 表 1 中 列 出 的 蛋白 点 编号 一 致 ， 蛋 白质 上 样 量 为 100 pg, 
IPG 胶 条 为 非 线性 ，13 cm 长，pH 3 ~ 10， 第 二 向 SDS-PAGE 凝 胶 浓度 为 12.596 (wv), BERRA S LE A SEIT IK. 

Fig. 1 2-DE reference maps obtained for nutritive corm (left) and secondary corm (right) 
Proteins that identified in this study are marked with arrows and numbers. The numbers correlate with protein identifications listed in 
Table 1. 2-DE was performed using 100 yg of protein, nonlinear 13 cm IPG strips (pH 3-10), and a 12.5% (w/v) total 
acrylamide SDS second dimension. Gels were silver stained, destained according to the method and images recorded. 


2.2 数据库 检索 与 蛋白 质 鉴定 
2.2.1 数据 库 的 检索 策略 ”根据 质谱 分 析 获 得 每 个 样品 的 一 组 同位 素 峰值 ， 设 定 物 种 或 
物种 门类 ， 在 较 宽 泛 的 分 子 量 和 等 电 点 范围 内 ， 逐 渐 升 高 质量 误差 ， 采 用 MS-Fit 和 Pept- 
Ident 分 别 进行 检索 ， 结 果 见 表 1。 表 1 综合 了 对 天 麻 新 生 球 茎 5 个 蛋白 质点 进行 分 析 鉴 定 
的 基础 数据 和 初步 结果 ， 包 括 蛋 白质 丰 度 、 分 子 量 和 等 电 点 实验 值 、 检 索 的 数据 库 以 及 检 
索 时 的 质量 误差 、 匹 配 的 肽 段 数 、 肽 序列 对 匹配 蛋白 的 序列 覆盖 率 、 理 论 分 子 量 和 等 电 
点 、 匹 配 蛋 白 的 名 称 及 其 GenBank 登记 号 、 对 应 的 物种 、 蛋 白质 功能 。 

设 定 的 质量 误差 较 低 ， 检 索 结果 的 可 信 度 就 较 高 。 但 本 次 检索 中 如 果 将 质量 误差 设 定 
为 100ppm， 几乎 都 没有 匹配 的 条 目 ; 将 质量 误差 设 定 在 200ppm 或 0.25 ~ 1.0Da, 检索 成 
功率 增加 。 由 于 待 鉴定 的 蛋白 质 来 源 于 兰 科 植物 ， 而 到 目前 为 止 还 没有 公布 任何 兰 科 植 物 
的 基因 组 全 序列 信息 ， 因 此 将 物种 范围 设 定 在 植物 界 或 拟 南 芥 进行 检索 ， 可 提高 基于 序列 
相似 性 匹配 蛋白 质 的 可 信 度 。 

在 豆 科 植物 首 蒂 各 器 官 的 蛋白 质 组 研究 中 (Watson 等 ，2003) ， 发 现 仅 在 蛋白 质数 据 
JE (SwissProt 和 NCBInr) 进行 检索 ， 和 蛋白 质 鉴 定 的 成 功率 只 有 25%; 而 在 EST 库 平 均 成 功 
率 为 46%。 当 然 ， MERE poly (A+) 尾巴 的 mRNAs (如 线粒体 和 叶绿体 编码 的 mRNAs) 


D: 000000000000 


Table 1 Summary of identified Gastrodia elata proteins with supporting data 





Spot Relative Exp. MW Databases/Mass # Pr Cov Theoret MW ре Accession Organism А 
Identification/Comment Function 
# — Abund. /% О kD[] /p/ olerance Peptides / 96 0 kDO /p7 Number Matched 
1 3.170 17/4.6 ND 1.0Da 5 23.0 28/5.4 MA3domain-containing protein NP_ 194797 А. thaliana Disease/ defense 
4 19.0 17/5.5 nucleoside-diphosphate kinase 151612 A. thaliana Metabolism 
2 0.884 16/4.7 ND 0.5Da 4 19.0 19/5.5 glycosyltransferase family 28 NP— 193404 — A.sthaliana Metabolism 
S/TD 1.0Da 5 29.7 21/5.6 lactoylglutathione lyase 004885 В. juncea Metabolism 
3 1.714 28/6.2 NSU 200ppm 4 12.0 40/5.2 leucoanthocyanidin dioxygenase (996323 A. thaliana Secondary metabolism 
S/TD 0.5Da 7 19.4 40/5 .2 leucoanthocyanidin dioxygenase (996323 A. thaliana Secondary metabolism 
4 2.643 29/6 .4 ХП 0.6Da 9 31.0 30/6.7 Probable RNA-binding protein D96792 A. thaliana Transcription 
30.0 26/7.0 Glutathione transferase[] putative М№Р__ 180505 А. thaliana Metabolism 
5 0.836 28/6.5 ХП 200ppm 6 22.0 32/5 .4 expressed protein NP_ 195060 A.thaliana Unclear 








ППППП ПП 00 GenBank] N= NCBlInr.[] S = SwissPro[] S/T = Swiss-Prot and TrEMBO OO 000 NO SOO MS-FtO OO S/TD] Peptldent D00000000000000 
OU00000 0000000000000000000000000000000000000000000000000000000000000000 
UU0O00000000000000000000000000000 

Note[] Accession number is GenBank number. N= NCBInr. 6.4.2003[] 1441081 епііе T] S = SwissPro. 5.27.2003[] 126844 entries [] S/T = Swiss-Prot and TrEMBI[] Swiss-Prot Release 41.11 of 
06-Jun-2003[] 127863 entries] TrEMBL Release 23.15 of 06-Jun-2003[] 857950 entries T] MS-Fit was used for searching database N or so PeptIdent was performed within VIRIDIPLANTAE 
of Swiss-Prot and TrEMBL. These data include an assigned protein spot numbef] see Figure 1[[] percent relative abundance of each protein[] experimental M, and p/[] database that yield concurrent 
identifications[] mass tolerance[] number of peptides matched[] percent protein coveragel] theoretical М, and p/[] database accession number of the best match[] the organism to which the matching 


protein was identified through similarity[] and protein function. 
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很 难 出 现在 EST 库 ， 因 此 同时 检索 多 种 数据 库 可 以 提高 蛋白 质 鉴定 的 成 功率 。 
2.2.2 蛋白质 的 鉴定 ”用 PMF 鉴定 蛋白 质 主要 基于 以 下 参数 : 匹配 的 肽 段 数 、 质 量 精 度 
(m/z accuracy)、 肤 序列 对 匹配 蛋白 全 长 的 序列 覆盖 率 (最 低 10%), 、 肽 谱 的 质量 、 匹 配 峰 
的 强度 (最 小 值 18% ~ 20% )、 分 子 量 和 等 电 点 实验 值 与 理论 值 的 差异 、 匹 配 和 蛋白 所 属 的 
物种 (Watson 等 ，2003 )。 蛋 白质 的 功能 分 析 在 蛋白 质 功 能 数据 库 Pfam (http: // 
www. sanger. ac. uk/Software/Pfam/) 中 进行 ; 按照 Bevan 等 (1998) 发 表 在 Nature 上 的 植物 基 
因 功 能 分 类 方案 ， 划 分 匹配 和 蛋白质 的 功能 类 别 。 

分 析 比 较 数据 库 的 检索 结果 ， 筛 选 最 适 匹 配 的 记录 ， 发 现 用 两 种 方式 都 被 鉴定 为 同一 
种 蛋白 质 的 只 有 第 3 号 蛋白 (spot no.3) 一 一 种 花 青 苷 合成 酶 ， 而 第 5 号 蛋白 (spot no.5) 
与 拟 南 芥 的 一 种 未 知 功能 的 表达 蛋白 最 相似 。 以 第 4 号 蛋白 点 (зро no.4) 为 例 ， 其 肽 质 
量 指纹 谱 见 图 2， 相关 的 检索 记录 中 以 RNA 结合 蛋白 (Асс. # : 096792) 匹配 最 好 ， 检 索 
结果 见 表 2。 根 据 植物 基因 的 功能 分 类 方案 ，RNA 结合 蛋白 的 功能 类 别 是 转录 ， 它 在 天 麻 

生 球 茎 大 量 表达 ( 丰 度 为 2.6%)， 可 能 与 旺盛 的 生长 发 育 密切 相关 。 
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图 2 双向 电泳 图 上 第 4 号 蛋白 点 的 肽 质量 指纹 谱 
Fig. 2 PMF of spot no.4 (TM-4) from 2-DE gel 
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Table 2 Database querying result of spot по. 4] Acc. # [] 096792] 





m/z Submitted MH* Matched Delta Da Missed Cleavages Peptide 

1284.4070 1284.6701 -0.26 0 ISNHFHITTSK 

1384.4630 1384.7007 -0.24 1 ACADPTPIIDGRR 

1384.4630 1384.7007 -0.24 1 RACADPTPIIDGR 

1792.3640 1792 .9234 - 0.56 0 VFVGGLAWETQSETLR 

2089.5970 2089 .0606 0.54 0 QHFEQYGEILEAVVIADK 

3312.2590 3311.7985 0.46 1 RANCNLASLGRPRPPLPY AVIPNMPDLLPR 
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